# -*- coding: UTF-8 -*-
# Project : bio_tc
# File : transfer.py
# IDE : PyCharm
# Author : 博科（鑫贝西）田聪
# Date : 2021/11/24 16:05
# 中转

from tools import loading

from tools.formprocess import form_handling,html_get_table
# from tools.businessname import extract
from tools.busces import extract,listjulist
from tools.strtoform import str_to_array

def jiaoji(list1,list2):
    """
    判断两个列表是否有交集
    :param list1:
    :param list2:
    :return:
    """
    return listjulist(list1,list2)

def tiqu_qiye_name(ysqymz:str):
    """
    提前企业名称
    :param ysqymz: 疑似企业名称的句子
    :return:
    """
    return extract(ysqymz) # type:list

def biaoge_str_to_df(html:str):
    """
    从网页中提取出表格
    :param html: 网页文本
    :return: 所有的dataframe列表
    """
    return html_get_table(html) # type:list

def biaoge_qiye_name(dataframe):
    """
    从表格中提取企业名称
    :return: 返回企业名称列表
    """
    return form_handling(dataframe)

def wenben_to_biaoge(html:str,url):
    """
    将用p标签写的表格转为表格
    :param html:
    :return:
    """
    return str_to_array(url,html)

def wenben_to_shuzu(url:str,html:str):
    """
    讲文本转换为二维数组
    :param url: 链接
    :param html: 网页源代码
    :return: 二维数组 arrary
    """
    return str_to_array(url,html)